1. 引言
本文提出的方案已被WSDM 2023接收,论文:Boosting Advertising Space: Designing Ad Auctions for Augment Advertising,
下载:https://dl.acm.org/doi/abs/10.1145/3539597.3570381
信息流产品为了保障用户体验通常会严格限制信息流中的广告曝光占比。稀缺的广告展示坑位难以满足广告主日益增长的广告投放需求,并且有限的广告供给量会进一步加剧广告主之间的竞争,导致点击价格(ppc)水位过高,进而降低了中小广告主的投放意愿。为了缓解这种情况,我们设计了将多个广告“打包”成一个二跳页的广告投放机制—— “增广拍卖” 。本文聚焦于大规模在线广告系统的可扩展性的增广广告拍卖机制设计。为了阐述清晰,本文会结合手淘的“微详情”二跳信息流的业务模式阐述增广拍卖的设计方案。值得说明的是,除了微详情页外该机制能够应用到任何其他支持二跳页的用户产品形式中,比如外投二跳页等。 如图1(b)所示,微详情业务下的增广广告的展示页面由三个部分组成:主页, “二跳广告”页(i.e., 微详情广告页) 和商品详情页。 在增广广告中,淘宝主页信息流展示的广告被称为“引导广告” 。当用户点击主页面上的“引导广告”时,用户将被显示一个“二跳广告”页。出于用户体验的考虑(i.e., 所见即所得),“二跳广告”页首坑位置展示的是用户在主页点击的“引导广告”。由于用户点击“引导广告”隐式表达出用户对该类相关物品的兴趣,所以“二跳广告”页在首坑以下的坑位展示的是与被点击的“引导广告”强相关的信息流广告。我们把这些“二跳广告”页上非首坑 的广告称为" 二跳广告(微详情广告) "。在微详情页中,广告的展示模式为微详情广告卡模式,每个微详情卡片展示了简短的产品信息,如价格、评价、销售量,短视频等;并为用户提供了更多的互动操作,如购买、添加到购物车、添加到收藏夹等。 为保障客户体验并兼顾平台长期收益,我们不仅要考虑投放广告的整体效率,还必须考虑到扣费设计对广告主策略行为所带来的影响。对增广广告的广告拍卖机制设计需要考虑到以下几个问题:
在大规模系统中,“引导广告”和“二跳广告”的异步检索过程导致“引导广告”排序效率优化的困难 。考虑到工程链路的效率问题,只有当用户点击“引导广告”后,系统才会生成二跳页。因此,当我们在主页决定“引导广告”排序时,其对应二跳页的潜在价值是未知的,这导致了优化增广广告整体社会福利的困难。
广泛应用的按点击计费方案存在潜在的 "搭便车 "问题,可能导致广告主的利益受损。 按点击计费的方案要求“引导广告”的广告主分别为用户在主页和“二跳广告”页面的两次点击分别付费。而用户可能在二跳页被其他相关广告分散注意力,不会再次点击“引导广告”以进入详情页。在这种情况下,“引导广告”会为主页面上的无效点击付费,而其他广告主则从“引导广告”所付费的流量中获益,这将影响“引导广告主”的投入产出比。因此,我们需要设计一个新的计费方案来避免这种 "搭便车 "的问题。
两阶段的拍卖机制之间的关系不清晰,导致现有拍卖机制经济学性质难以保证。 从优化增广广告整体效率来说,“引导广告”的排序必定受到二跳页的潜在价值的影响。然而,广泛应用的GSP拍卖和VCG拍卖由于没有考虑到二跳页的潜在价值无法实现社会福利最大化,进而不能保证拍卖的经济学性质,影响广告市场的长期繁荣。
针对这个两阶段的广告展示场景,我们首先将拍卖设计解耦为一个两阶段的拍卖机制设计,包括一个“引导广告”拍卖 和一个“二跳广告”拍卖 (i.e., 微详情广告拍卖)。我们为“引导广告”拍卖设计了新的 Potential Generalized Second Price~(PGSP) 拍卖机制,并将计费点后移到用户在二跳页对“引导广告”的再次点击以应对“搭便车”问题。同时,PGSP机制对广告的排序和扣费都考虑了潜在二跳页的收益。我们证明了新提出的拍卖机制存在非空的对称纳什均衡(Symmetric Nash Equilibrium, SNE)。相较于广泛应用的GSP和VCG广告拍卖机制,我们提出的机制在社会福利和广告收入上均有提升。至于“二跳广告”拍卖,在给定“引导广告”的前提下,其投放形式跟传统的广告投放形式一致,因此我们仍采用常规的GSP拍卖机制。 2. 问题建模 信息流主页广告及其“二跳广告”页面的拍卖过程被解耦为两个独立拍卖:“引导广告”拍卖 和“二跳广告”拍卖 。如图2所示,在用户访问淘宝主页时,平台将发起一次“引导广告”拍卖以确定主页的“引导广告”排序与计费。当用户点击了主页中的“引导广告”后,平台会发起一次“二跳广告”拍卖以确定对应的“二跳广告”页的广告排序与计费。每次拍卖过程包括都包括完整的召回,粗排,精排,计费过程。 一次“引导广告”拍卖中有 个广告主的集合 在竞争主页上的 个“引导广告”坑位。每个广告主 都有一个私人估值 ,他会向系统提出一个竞价 以表示愿意为这次点击支付的最高价格。 表示所有“引导广告主”的出价,其中 。我们对主页的 个坑位采取分离点击率的假设,即“引导广告”被二次点击的概率可以分解为 ,其中 是曝光率,表示广告在第 个坑位被曝光给用户的概率。很明显,曝光率 是随着位置降低而递减的,即 。 是广告商品的pCTR,即被广告曝光后被首次点击的概率。 表示用户再次点击二跳情广告页上的“引导广告”的概率。在本文中,我们不失一般性地假设广告 为放在第 个位置的广告。 在用户点击“引导广告” 后,平台将会发起一轮二跳拍卖。在该拍卖的召回阶段中,系统对召回物料做一次相关性过滤,精排后的候选广告集合为 。 代表“二跳广告” 的估值和点击率。在收到一条用户对主页的请求后,“引导广告”的排序和计费由拍卖机制( ) 决定。具体来说,分配规则 是一个函数,它将所有广告主的出价作为输入,并输出广告序列 和 ,其中 表示在主页上的“引导广告”序列, 表示“引导广告” 所对应的“二跳广告”页面上的“二跳广告”序列。在产生了广告序列后,平台会按照计费规则 计算每个“引导广告” 在“二跳广告”页被再次点击所需要付出的费用 。因此,获胜的“引导广告主” 的效用是 。 “引导广告”拍卖的目标是最大化所有广告主的期望社会福利 (expected social welfare),使得满足即我们需要分别确定广告序列 和 来最大化下面这个式子: 这个式子代表“引导广告”以及对应“二跳广告”的期望社会福利总和。为了广告市场的稳定性,我们还要求广告拍卖机制存在某种博弈论的均衡,比如对称纳什均衡。 定义1. 我们称一组广告主达到了对称纳什均衡(Symmetric Nash Equilibrium),如果任意一个广告主都不能通过与其他人交换位置而得到更好的utility,即对任意 , 。3. 机制设计 3.1 引导广告拍卖机制 在“引导广告”拍卖中,我们首先假设已经得知“二跳广告”的社会福利 , 那么式子(1) 的优化目标就可以转换为 这样,“引导广告” 在第 坑位展示的期望社会福利即 。由于 是随着位置下移而递减的,所以我只需要将“引导广告”按照 降序排序并取前K个广告即可得到最大化式子(1)的最优展示序列。基于此项观察,我们设计了Potential GSP (PGSP)拍卖机制 ,详细定义如下: 排序方案 :我们按照期望社会福利 对“引导广告”做降序排序,并取前K个“引导广告”作为最终展示序列。 扣费方案 : 为了避免“搭便车”问题的出现,我们对用户在主页对“引导广告”的第一次点击不计费,只对在二跳页对“引导广告”的二次点击进行计费。我们采用GSP的计费机制的思想,对每个“引导广告”收取他能保持当前位置的最小价格。在我们新的排序方案下,每个曝光广告主 的价格为 我们可以证明PGSP机制一定存在非空的对称纳什均衡解。我们将证明过程放在了附录中。 定理1. 在PGSP拍卖机制中一定存在一个非空的对称纳什均衡解。 此外,考虑到如果, 存在为负数的情况。这种情况在较少发生,因为二跳页的收益 通常远小于“引导广告主”的eCPM。尽管如此,我们为了尽量避免这种情况的发生,我们为每一个广告都设定了一个足够低的保留价 ,并另最终的点击价格为 。 在“二跳广告”拍卖中,我们直接采取GSP拍卖机制,就不再做过多介绍。整体拍卖流程如图3所示。 3.2 虚拟竞价的预估 最后需要解决的问题就是如何预测每个“引导广告”所产生的二跳页面的收益 。这可以建模为一个回归任务并使用轻量级的机器学习模型进行预测。 标签 :我们考虑了两种方案来作为预估标签。第一个方案是使用用户在二跳页的点击所产生的广告收入作为标签。第二个方案是使用用户在二跳页曝光广告的ecpm总和作为标签进行预估。然而,如果采用第一个方案,如果将广告收益定义为二跳页增量收益,则与式子(1)中最大化social welfare的目标不一致。此外,样本中会存在大量广告消耗为零的样本,这些由于部分用户在二跳页为未点击任何广告而直接退出所导致的。这些样本会导致模型学习到的分布存在严重的偏差。 在采用第二个方案前,我们随机抽取了部分“引导广告”并观察其所产生的二跳页中曝光广告的eCPM总和的分布。我们发现eCPM的对数是服从高斯分布的,如图4所示。所以我们最终采用二跳页曝光广告的log ecpm作为标签进行训练回归模型。 特征: 我们采用了用户特征(用户id),“引导广告”特征(品牌,销量,价格等)以及RTP模型的预测信息(pCTR,pCVR)作为模型输入特征。值得一提的是,为了保证广告拍卖机制的理论性质,我们将广告主的bid剔除在输入特征外。模型: 考虑到链路时延问题,我们采用简单的多层神经网络来搭建回归模型。4. 实验 为了充分验证业务以及提出的拍卖机制的表现,我们使用淘宝主页信息流采集的数据集对我们提出的增广广告业务以及PGSP拍卖机制进行了离线实验。 4.1 离线实验 我们在离线实验环节中分别验证了采用PGSP机制是否能带来更多的广告收益?以及在采用PGSP机制的前提下,virtual bid的预测模型的准确度对用户的浏览和广告收益有什么影响? 首先,我们验证与广泛应用的GSP拍卖机制和VCG机制相比,在增广广告业务中采用PGSP机制是否能够给广告收益和用户体验带来增益。我们关注如下评价指标: 每条流量平均点击量 (CPS): ,其中 代表用户在主页产生的点击, 代表用户在对应二跳页面产生的点击。 CPS和RPS反映了用户对投放的广告的满意程度。在图6 (a) 和图6(b)中,我们比较了在主页投放 个坑位的情况下不同拍卖机制产生的CPS和IPS,其中 。从图中我们可以得知,相较于GSP和VCG机制,PGSP机制所产生的“引导广告”可以吸引用户在二跳页面产生更多的浏览和点击。这是由于PGSP拍卖机制在排序时考虑了潜在的二跳页的质量,从而将更容易吸引用户浏览和点击相关广告的“引导广告”排在前面。 在图6 (c) 中我们同时观察了在不同拍卖机制下每个坑位的平均价格。我们发现PGSP拍卖机制下每个坑位的平均价格会略小于使用GSP拍卖机制的平均价格,这说明PGSP拍卖机制能在一定程度上缓解拍卖的竞争激烈程度。虽然PGSP拍卖的平均价格更低,但是从图6 (d) 中我们可以得出PGSP拍卖机制相比GSP拍卖机制和VCG拍卖机制来说可以产生更多的广告收益,这大多是来源于用户在二跳页更多的点击所带来的收益。 然后,我们评估了模型的性能和广告收益的之间的关系。由于没有可以参考的相关工作,我们仅使用线性回归模型(LR), GBDT模型和MLP模型作为比较模型。我们采用均值模型(MEAN Model)作为比较基准。均值模型使用广告商品的二跳页收益的历史均值作为virtual bid中的预估值 。 我们采用Normalized Root Mean Square Error (NRMSE) 来评估不同模型的表现,同时使用前五个坑位的累计RPS, CPS,IPS(用RPS@5, CPS@5,IPS@5表示)来评估不同模型下的广告收益,如表2所示,我们可以推论出使用MLP模型能够得到更好的模型表现,同时也能相应提升更多的广告收益。 4.2 在线实验 我们在淘宝主页的“猜你喜欢”信息流中对增广广告业务模式进行了为期三周的在线A/B测试,并观察了投放增广广告相较于投放传统展示广告的PV,Clicks,GMV,广告收益(REV)和平均价格(AVG.CPC)的提升。值得一提的是这些指标都是将二跳页的数据纳入了统计范围。如表3所示,通过投放增广广告业务,平台的PV,Click,GMV都得到相应的提升。拍卖的平均价格因为更多的广告展示坑位缓解了拍卖的竞争压力而得到了下降。尽管如此,采用增广广告形式的广告收入仍然得到了增长。 5. 总结 本文介绍了一种新的广告投放模式——增广广告,它通过在用户浏览路径中插入广告二跳页面的方式扩充广告的展示空间,以探索广告收入的潜在提升空间。我们为这个新形式广告展示形式设计了两阶段解耦的广告拍卖,即“引导广告”拍卖和“二跳广告”拍卖。为了优化整体效率,我们为“引导广告”拍卖设计了被称为PGSP的拍卖机制,它基于数据模型预估的virtual bid对“引导广告”进行排序和计费。我们从理论上证明了潜在Potential Generalized Second Price~(PGSP) 拍卖的经济性质,并在淘宝主页信息流上部署了增广广告业务,大量的离线和在线实验数据表明增广广告相比一些现有方案在用户指标和广告收益指标上都能得到更好的效果。 6. 参考文献 [1] Xiang Chen, Bowei Chen, and Mohan Kankanhalli. Optimizing trade-offs among stakeholders in real-time bidding by incorporating multimedia metrics. In Proceedings of SIGIR, page 205–214, 2017.
[2] Paul Dütting, Felix A. Fischer, and David C. Parkes. Truthful outcomes from non-truthful position auctions. In Proceedings of EC, page 813, 2016
[3] Negin Golrezaei, Max Lin, Vahab Mirrokni, and Hamid Nazerzadeh. Boosted second price auctions: Revenue optimization for heterogeneous bidders. In Proceedings of SIGKDD, page 447–457, New York, NY, USA, 2021.
[4] Varian H R. Position auctions[J]. international Journal of industrial Organization, 2007, 25(6): 1163-1178.
[5] Xiangyu Liu, Chuan Yu, Zhilin Zhang, Zhenzhe Zheng, Yu Rong, Hongtao Lv, Da Huo, Yiqing Wang, Dagui Chen, Jian Xu, Fan Wu, Guihai Chen, and Xiaoqiang Zhu. Neural Auction: End-to-End Learning of Auction Mechanisms for E-Commerce Advertising. In Proceedings of KDD, pages 3354–3364, 2021.
[6] Yiqing Wang, Xiangyu Liu, Zhenzhe Zheng, Zhilin Zhang, Miao Xu, Chuan Yu,and Fan Wu. On designing a two-stage auction for online advertising. In Proceedingsof WWW , page 90–99, New York, NY, USA, 2022.
▐ 关于我们 我们是阿里妈妈展示广告机制策略算法团队,致力于不断优化阿里展示广告技术体系,驱动业务增长,推动技术持续创新;我们不断升级工程架构以支撑阿里妈妈展示广告业务稳健&高效迭代,深挖商业化价值并优化广告主投放效果,孵化创新产品和创新商业化模式,优化广告生态健壮性;团队创新工作发表于 KDD、CIKM、WSDM、AAAI 等领域知名会议。在此真诚欢迎有ML背景的同学加入我们~ alimama_tech@service.alibaba.com
关注「阿里妈妈技术」 , 了解更多 ~ 喜欢要“分享”,好看要“点赞”ღ~
↓欢迎留言参与讨论↓